#MiniMax Agent | 熱門關鍵字 | 鉅亨號

為何人人都在 token 焦慮？千呼萬喚，2026 年 6 月 1 日兒童節當天，MiniMax 第三代旗艦模型 M3 終於發佈了。光看官方解讀，六個關鍵詞就可以概括這款模型的全部亮點：Coding 能力、1M 上下文、原生多模態、Computer Use、低價 Token Plan、開源。能力上，作為國內首個集齊了 Frontier 三件套——前沿 Coding/Agentic 能力、百萬 token 級超長上下文、原生多模態的開源模型的國產模型，M3 的實力不必多提。

科技

2026/02/20

•

1個月賺60億，紅杉贏麻了！還有高瓴阿里騰訊，員工人人500萬富翁

2月19日消息，2月16日A股休市，港股半日市，港股的表現可圈可點，一直被詬病的恆科更是先抑後揚，收盤翻紅喜迎新春。大家看港股人氣榜，雙方走勢反差強烈，一邊是新科小登：兆易創新大漲近10%，瀾起科技暴漲14%，智譜一度突破540港元，mimimax暴漲24.56%；另一邊則是老登恆科們萎靡疲軟，一副無精打采的樣子，美團跌、小米跌，中芯跌、阿里跌、京東跌，騰訊微紅。於是，一種聲音在市場開始傳播，那就是以阿里、騰訊、美團、小米為主的老恆科，正在被瀾起科技、兆易創新、智譜以及即將上市的中際旭創、勝宏、滬電等“新恆科”所取代。知名百億私募創始人王一平發帖：恆科網際網路巨頭長期待在舒適區裡，改革的決心和內部的頑固既得利益對抗消耗，那怕資本市場持續下跌，也無法改變這一宿命。要不期待雄主出馬力排眾議堅定改革，要不新事物大概是開始取代舊事物的處理程序中了。此前金石雜談曾談過智譜，在智譜股價400元左右的時候，徐新已經爆賺15倍，還有騰訊小米都賺了超10倍，美團賺了近20倍，螞蟻賺了近10倍。如今徐新和恆科們只會賺的更多。今天，金石雜談帶大家簡單聊一聊minimax，作為港股大模型“第二股”，minimax在1月9日上市，發行價165港元，如今最高886港元，1個月時間暴漲437%，在新春即將到來之際，股民喜提“886”超級大紅包。僅今天一天，一手最多可賺3340港元。公司股價暴漲背後，一是發佈新型大模型。2月13日，MiniMax正式宣佈上線新一代文字模型MiniMax M2.5。據介紹，該模型定位為“原生Agent生產級模型”，目前已在MiniMax Agent平台上線，並支援全球開源及本地化部署。據悉，M2.5在程式設計、工具呼叫和搜尋、辦公等場景都達到行業領先；此外，在該公司內部真實業務場景中，整體任務的30%由M2.5自主完成，覆蓋研發、產品、銷售、HR、財務等職能，且滲透率仍在持續上升。二是，豆包一些列模型刺激，讓大模型概念不斷被炒作。尤其春節前後，智譜、豆包、千問、deepseek等一系列模型出爐，讓大模型概唸成為資本市場寵兒。三是，智譜股價的帶動。作為大模型第一股，智譜發行價116.2港元，早盤一度觸及540港元，2月暴漲124%，這或讓2月股價落後的minimax存在進一步補漲需求。金石雜談查詢發現，MiniMax成立於2022年初，該公司擁有MiniMax M2、Hailuo-02和 Speech-02為核心的自研大模型組合，具備長上下文處理能力，可理解、生成並融合文字、視覺、音訊等多種模態。招股書顯示，MiniMax2025年前九個月營收同比增長超過170%，海外市場收入貢獻佔比超70%。截至2025年9月30日，MiniMax已有超過200個國家及地區的逾2.12億名個人使用者以及超過100個國家的13萬企業客戶。該公司主要通過向個人使用者提供MiniMax、MiniMax語音、海螺AI和Talkie/星野等AI原生應用的訂閱服務創收，AI原生產品收入佔比超70%。還有為企業客戶和開發者提供API服務。業績方面，22年收入為零，23年346萬，24年3052萬，25年前9月實現收入5343.7萬元；同期分別實現虧損7372.8萬元、2.69億元、4.65億元以及大幅虧損（68%）至5.12億元。由於需要大幅研發和投入，持續燒錢之下，minimax吸引一眾明星資本加持。首先，該公司採用同股不同權，B類股有10票投票權；控股股東為閆俊傑，上市後持股大約25.9%，禁售期2年。此外，公司明星股東雲集，上市以來共計融資14.75億美元，雲集了頂級PE/VC紅杉資本、高瓴資本，科技巨頭阿里騰訊，知名國資中國人壽、中金資本等等，還有公募易方達、匯添富等頭部公募。上市後，米哈游持股5.24%，IDG持股2.57%，李澤楷旗下Bravo Ideas持股1.17%，阿里巴巴持股大約12.52%，騰訊持股2.37%，高瓴持股1.13%，紅杉資本持股2.95%，雷軍旗下順為資本持股1.61%，明勢資本持股0.82%。此外，公司還雲集了小紅書、經緯創投、中金資本、博裕資本、中國人壽旗下科技私募以及國際知名資本阿布扎比投資局等知名機構。根據招股書，minimax2021年12月開始天使輪，成本只有1.69美元，如今股價高達847港元，天使輪投資4年時間爆賺63倍；按已知騰訊投資超2.5億美元計算，目前持股7232084股對應市值7.84億美元，2年賺了214%，浮盈5.34億美元，折合36.9億人民幣；此外，李澤楷持股1.17%，僅上市以來就浮盈25億港元；高瓴資本僅上市以來浮盈24.2億港元，紅杉資本僅上市以來浮盈63.2億港元。金石雜談查詢天眼查發現，元啟資本在天使輪投資了minimax，且連續投資六輪，騰訊在A輪（23年6月）投資了超2.5億美元，阿里巴巴在24年3月投資了6億美元，彼時估值25億美元。招股書顯示，公司員工共有385人，平均年齡僅29歲，董事會平均年齡為32歲（90後），而公司員工持股計畫高達392人（包括前員工），這就意味著幾乎全員持股。員工持股計畫合計持股20890736股，行使價介乎0-0.8美元，人均持股5329股，對應目前市值451萬港元。招股書顯示，MiniMax此次全球發售引入了包括阿里巴巴、阿布扎比投資局（ADIA）、Aspex Management等在內的14家基石投資者，普遍浮盈4.13倍。基石中，阿布扎比成最大贏家，獲配306.5萬股，本次上市已浮盈21億港元；阿里再度投資3000萬美元，博裕資本投資3500萬美元，匯添富投資1500萬美元，易方達投資1000萬美元，泰康人壽投資2000萬。(金石雜誌)

A股

2026/02/15

•

2026年，人在度假，MiniMax Agent在上班

上周四晚上正準備關電腦睡覺，微信突然彈出來一條消息。是之前認識的一個學妹，大二，視覺傳達專業。她發了一大段語音，大意就是最近很焦慮，不知道該不該考研，想讓我這個“過來人”給點建議。可能是因為他聊過，辭職之後，一部分精力會去做設計師的職業規劃業務。我看了眼日曆，這周還有兩篇公眾號要趕，明天公司裡還要做設計評審。以前遇到這種事兒，要麼敷衍兩句“看你自己啊”，要麼就得熬夜幫她做分析——去招聘網站扒資料、翻各種就業報告、整理成文件，少說也得兩三天。但這次我沒熬夜。我打開MiniMax Agent Desktop，花了10分鐘配置了一個任務，然後……就真的去睡覺了。第二天早上起來一看，電腦桌面上躺著三個檔案——一份13頁3000+字的Word分析報告、4張資料表、14頁的PPT。我快速掃了一遍內容，臥槽，這質量比我自己熬夜做的還TM專業。簡單潤色了一下措辭，9點鐘我把報告發給學妹。她秒回：“學長你昨晚沒睡吧？這也太詳細了……我都不好意思了。”我沒告訴她真相。因為我突然意識到一件更重要的事：2026年了，那些還在用“時間換產出”的人，可能真的要被淘汰了。職業規劃諮詢，是個最磨人的體力活。做過類似工作的人都懂，幫別人做職業規劃分析有多費勁。首先是資料蒐集這關就能把人逼瘋。你得去BOSS直聘、拉勾網一個個搜“UI設計師”“視覺設計師”“平面設計”，記錄不同城市、不同工作年限的薪資範圍；你得去各大美院、設計院校的官網翻就業質量報告，看看去年視覺傳達專業的學生都去了那兒、拿了多少錢；你還得在知乎、小紅書扒拉半天，找那些真實設計師的吐槽貼，看看他們到底過得怎麼樣。光這一步至少要花一整天。更要命的是，資料蒐集完了還得分析。考研和直接工作，那個5年後收入更高？研究生學歷在設計行業到底值不值？AI都開始做海報了，視覺設計師還有沒有未來？這些問題你不能拍腦袋，得拿資料說話，得做對比表格，得畫趨勢圖。最後還得根據這個學生的具體情況給建議。家裡有礦的和急著賺錢養家的，能一樣嗎？作品集已經很牛的和連PS都用不溜的，能一樣嗎？你得針對性地分析，不能給標準答案。所以每次有人找我做職業規劃，我都很頭疼。不是不想幫，是真TM費時間。而且說實話，這種重複性的資料蒐集和整理工作，根本配不上我10年的行業經驗——我的價值應該在“判斷和決策”上，而不是在“複製貼上薪資數字”上。直到這次，我發現MiniMax Agent Desktop可以把這些髒活累活全接過去。兩小時，從任務配置到報告交付那天晚上我其實只幹了一件事：告訴MiniMax Agent我要什麼。我打開Desktop版（option+A快速鍵直接喚起小窗，這個細節我很喜歡），然後用自然語言描述了任務：“幫我做一份視覺傳達專業考研vs直接就業的對比分析報告。需要包含：2025—2026年本科生和研究生的就業資料（薪資、崗位、學歷要求），熱門考研院校的報錄比和費用，5年總收入對比，以及AI時代設計師的職業建議。最後生成Word報告、Excel資料表和PPT匯報版。”然後我就去睡了。第二天早上看到結果的時候，我是真的有點懵。因為它不只是簡單地“搜尋+複製貼上”，而是真的在“工作”。它自動搜尋了網上2025—2026年視覺傳達相關崗位的薪資資料，按城市、工作年限做了分類統計；甚至還去知乎、小紅書抓了一些真實設計師的經驗分享，作為案例補充。更牛逼的是，它不只是搬運資料，還做了深度分析。比如Excel裡有一張表，對比了“本科”和“讀研”的不同工作年限工資差距，。這種需要綜合計算和邏輯推理的活兒，它也能幹。Word報告更誇張，3000多字，結構完整、邏輯清晰，每個結論都有資料支撐。甚至還專門寫了一章“AI時代設計師的核心競爭力”，分析了那些設計工作正在被Midjourney、Stable Diffusion替代，那些能力AI暫時學不會。這TM不是簡單的資訊整合，這是有思考深度的。PPT就更不用說了，15頁，該有的對比圖表、資料可視化全都有，範本還挺專業。直接就能用，比如這頁考驗成本全景分析。整個過程我投入的時間：10分鐘配置任務 + 20分鐘潤色修改 = 半小時。以前我自己做，至少要2—3天。這不是“AI助手”，這是“數字員工”用完之後我一直在想一個問題：MiniMax Agent Desktop和那些網頁版AI助手，到底有什麼本質區別？後來我想明白了：網頁版AI是在“幫你”工作，Desktop版是在“替你”工作。什麼意思呢？你用ChatGPT、Claude這些網頁版AI的時候，基本上是這樣的：你問一句，它答一句；你讓它搜尋，它給你一堆連結；你讓它整理資料，它給你一段文字，然後你得自己複製到Excel裡。整個過程你得一直盯著，一步步喂prompt，像個監工一樣。但MiniMax Agent Desktop不一樣。你給它一個複雜任務，它自己去網上找資料（Web Automation），自己在本地生成檔案（直接操作Excel、Word、PPT），自己做分析和推理（M2.5模型的深度理解能力）。你不用管中間過程，只需要驗收最終結果。這就是“AI原生工作台”和“套殼瀏覽器”的區別。舉個具體例子。我讓它去BOSS直聘抓薪資資料，它不是簡單地給我一個搜尋結果連結，而是：自動打開BOSS直聘網頁自動輸入搜尋關鍵詞“產品經理北京”自動翻頁，抓取前100條招聘資訊自動提取薪資範圍、學歷要求、技能要求自動在本地生成Excel表格，按薪資區間做統計整個過程我不用管，它自己跑。這TM才叫自動化，這才叫“數字員工”。就像上面這張圖片，我在發出了指令之後，右側就自動打開了boss直聘的網站，繼續接下來的查詢操作。更關鍵的是，它能操作本地檔案。網頁版AI再牛逼，也只能給你生成一段Markdown文字，你還得自己複製到Word裡、調格式、插圖表。但Desktop版直接在你電腦上生成標準的.docx、.xlsx、.pptx檔案，打開就能用。這看起來是個小細節，但對於真實的工作場景來說，這是決定性的差距。因為工作交付的最後一環永遠是“檔案”，不是“對話方塊裡的一段文字”。專家Agents：把自己放大100倍更狠的是Expert Agent：把經驗封裝成系統用完這次之後，我又幹了一件事：把這整套分析邏輯封裝成了一個Expert Agent。什麼意思呢？就是我把我10年做職業規劃諮詢的經驗、方法論、判斷標準，全都寫成了一套指令，喂給了MiniMax Agent。然後我給它起了個名字，叫“職業規劃專家——設計方向”。建立的過程也是對話式的，操作非常自然，需要那些能力，比如建立檔案、建立表格等等，直接把要求傳送出去就可以了。現在如果再有學生來問我類似的問題，我不用每次都重新配置任務了。我直接呼叫這個Expert Agent，輸入學生的專業、年級、困惑、傾向，它自動就能生成一份定製化的分析報告。這才是最牛逼的地方。以前我幫一個學生做職業規劃，只能幫一個，因為我的時間有限。但現在我有了這個Expert Agent，我可以同時幫100個、1000個學生，而我自己的時間成本幾乎為零。而且這個Agent不只是簡單的Prompt範本，它是真的有“專家能力”的。我可以給它上傳私有知識庫（比如我這些年積累的行業報告、薪資資料、案例庫），可以配置特定的分析邏輯（比如“如果學生家庭經濟壓力大，優先推薦直接就業路徑”），甚至可以讓它呼叫外部API（比如即時查詢最新的招聘資料）。這就不是一個簡單的“AI助手”了，這是一個真正的“專家分身”。除此之外，我還建立了另一個資訊收集專家。作為一個自媒體博主，需要每天關注AI領域最新的新聞，最好是能夠直接找到那些價值比較高的新聞，來作為選題或者是重要知識的輸入。每天把時間花費在搜尋資訊上，實在太浪費了。所以這裡我又建立了一個資訊收集專家，每天幫我收集AI領域的新聞，並形成一個表格，寫明新聞的名稱、連結、重要程度以及這篇新聞能用來寫什麼選題。最後得到的excel表格（共有十幾條，只展示了一部分）巧了，新聞第一位的就是MiniMax-M2.5發佈，程式設計能力對標Claude 4.6。這TM才是AI時代的正確打開方式——不是讓AI替代你，而是讓AI放大你。你還是那個有10年經驗的資深設計師，但現在你可以“分身”成100個你，可以把你的能力規模化復用。還可以讓AI變成你的員工，你來當老闆佈置任務，最後只看結果！那些“AI辦公助手”，大多數隻是在Office軟體裡加了個側邊欄，能幫你潤色文字、生成大綱，但做不了端到端的任務。你還是得自己搜資料、自己整理、自己排版。只有MiniMax Agent Desktop是真的把“搜尋——分析——生成——交付”這整條鏈路打通了。而且它用的是M2.5模型，在Excel高階處理、深度搜尋調研、長文件摘要這些核心生產力場景裡，確實比其他模型強。2026年的工作方式我現在甚至在想一個更激進的場景：如果我有一天真的去日本度假，客戶突然要改方案，我是不是可以直接讓我的“UX設計專家Agent”接手？我在溫泉酒店泡澡，它在後台幫我做競品分析、生成設計方案、輸出PRD文件，然後發給客戶。客戶確認通過，我收到通知，繼續泡我的澡。這TM才是2026年該有的工作方式——人在度假，Agent在上班。說點實在的，寫到這兒可能有人會問：這麼牛逼，是不是要收費？目前Mac和Windows都能使用Expert Agent功能，你可以自己建立，也可以用官方和社區提供的現成Agent。唯一需要注意的是，如果你要跑特別複雜的任務（比如我這次的職業規劃分析，涉及大量網頁抓取和檔案生成），可能會消耗比較多的算力，需要訂閱會員。但說實話，如果這個工具能幫你省2—3天時間，這個錢花得值。目前作者每個月在各個AI工具上的付費早就超過了1000元。目前MiniMax Agent Desktop已經支援Windows和Mac雙版本，而且Windows版的檔案操作適配做得很好。我知道很多AI工具都是先做Mac版，Windows版就是個半成品，但MiniMax這次是真的下功夫了。畢竟國內大部分職場人還是用Windows，這個適配很關鍵。這才是2026年該有的工作方式，這才是MiniMax Agent 2.0想做的事情：不是讓AI替代人，而是讓每個人都能擁有一支“專家團隊”。還有一個小技巧：如果你是做內容創作、市場營運、資料分析這些工作的，強烈建議試試Desktop版的Web Automation功能。比如自動監控全網輿情、自動下載爆款視訊素材、自動生成資料報表，這些以前需要寫Python指令碼才能實現的功能，現在用自然語言描述一下就能跑起來。2026年了，那些還在用“我熬夜加班所以我牛逼”來證明自己的人，可能真的要被淘汰了。因為有些人已經開始用“我睡了一覺AI幫我把活兒幹完了”來定義效率了。 (AI高手杜小虎)

科技

2026/02/13

•

來自MiniMax M2.5的震撼：小尺寸幾乎打平opus4.6，巨便宜，巨能幹活，速度巨快

MiniMax M2.5 正式發佈了，可以說這是一個相當優秀的國產模型，國產模型每一家都有自己的聚焦，MiniMax在進行的是極致最佳化，沒有過多花哨的技術實驗，專注於推出的是一款極其方便部署，價格具實惠，能幹活，性能對標世界頂尖的模型，咱也不尬吹，資料好看不代表真實體驗就好，但至少M2.5的確是在向真實生產環境可用和體驗在努力我先放兩張圖大家感受一下MiniMax的進化，看一下MiniMax M系列的來時路：尺寸對比，這就有意思了，感覺具有極高的可用性，非常適合家庭實驗室部署,據說推理服務提供商或許能在這個模型上挖掘出驚人的每秒token生成速度我們來看看MiniMax M 2.5 做到了什麼以及如何做到的MiniMax M 2.5做到了什麼首先看硬指標，它在各項SOTA性能上表現搶眼：MiniMax 測試了Agent工作流程中最重要的三項基準測試：SWE-Bench（它能否真正修復真實程式碼庫中的真實錯誤）、BrowseComp（能否搜尋網路並找到正確的資訊）和 BFCL（能否可靠地呼叫工具）。測試結果分別為 80.2%、76.3% 和 76.8%針對複雜任務，M2.5進行了執行效率的最佳化，速度提升了37%，速度提升聽起來似乎只是錦上添花，但當你運行一個Agent循環，模型在每個任務中呼叫自身 50 次以上時，速度的提升就顯得至關重要了每秒100token運行，每小時成本僅需1美元，這讓長周期Agent的無限擴展在經濟上成為了可能。具體來看，M2.5在以下幾個維度實現了突破。像架構師一樣思考的程式碼能力在程式設計評估中，M2.5相比前代產品有了顯著提升，達到了SOTA水平，尤其是在多語言程式設計任務中表現突出。與以往最大的不同在於，M2.5展現出了軟體架構師的思維與規劃能力。在訓練過程中，模型湧現出了編寫規格說明書的傾向：在敲下第一行程式碼前，它會主動從資深架構師的視角出發，對項目的功能、結構和UI設計進行拆解與規劃。在超過20萬個真實世界環境中，針對Go、Rust、Python、Java等10多種程式語言進行了訓練。這使得M2.5的能力遠超簡單的程式碼修復，而是覆蓋了複雜系統的完整開發生命周期：從0到1的系統設計與環境搭建，到1到10的開發，再到後續的功能迭代、程式碼審查和系統測試。它能處理跨Web、Android、iOS和Windows的全端項目，涵蓋伺服器端API、業務邏輯和資料庫，而不僅僅是前端網頁的演示。在更複雜的VIBE-Pro基準測試中，M2.5的表現與Opus 4.5持平。在SWE-Bench Verified評估集的Droid和OpenCode不同程式碼代理框架下，M2.5的得分分別為79.7和76.1，均超越了Opus 4.6。更精準的搜尋與工具呼叫為了應對更複雜的任務，高效的工具呼叫和搜尋能力是必選項。在BrowseComp和Wide Search等基準測試中，M2.5均取得了業界領先的成績。即便面對不熟悉的腳手架環境，它的表現也更加穩定。針對現實中專業人士不僅僅是使用搜尋引擎，而是需要在資訊密集的網頁中進行深度探索的特點，MiniMax建構了RISE評估體系。結果顯示，M2.5在真實場景下的專家級搜尋任務中表現優異。更重要的是決策效率的提升。相比前代M2.1，M2.5在解決同類任務時使用的輪次減少了約20%。這意味著模型不再僅僅是找對答案，而是在用更高效的路徑進行推理。真正的辦公場景交付M2.5在訓練之初就確立了產出可交付成果的目標。通過與金融、法律和社會科學領域的資深專家深度合作，將行業隱性知識注入模型訓練流程。這使得M2.5在Word、PowerPoint和Excel金融建模等高價值工作場景中能力顯著提升。在內部建構的Cowork Agent評估框架GDPval-MM中，通過對交付物質量和代理軌跡專業性的雙重評估，M2.5在與主流模型的對比中取得了59.0%的平均勝率。極致的效率與成本控制現實世界充滿各種deadline，速度即正義，現在模型都太貴了，我們急需要一款能打的便宜的模型M2.5的原生服務速度達到每秒100 token，幾乎是其他前沿模型的兩倍。加上強化學習對高效推理的激勵，其在複雜任務上的時間節省效果明顯。以運行SWE-Bench Verified為例，M2.5完成每個任務平均消耗352萬token，端到端執行階段間從31.3分鐘縮短至22.8分鐘，速度提升37%。這一速度與Claude Opus 4.6相當，但單任務總成本僅為後者的十分之一。為了實現智能不僅強大而且便宜到無需計費的願景，M2.5推出了兩個版本：M2.5-Lightning：穩定吞吐量每秒100 token，每百萬輸入token 0.3美元，輸出2.4美元。M2.5：吞吐量每秒50 token，價格減半。這意味著，以每秒100 token的速度連續運行一小時僅需1美元。如果以每秒50 token運行，價格降至0.3美元。換算下來，只需1萬美元，就可以讓4個M2.5實例連續運行一整年。從去年10月下旬至今，M2系列經歷了三次迭代，改進速度超出了預期，特別是在SWE-Bench Verified基準上，進步速度明顯快於Claude、GPT和Gemini系列。MiniMax M 2.5如何做到的這一切進步的核心驅動力來自於強化學習的規模化。MiniMax將公司內部的任務和工作空間轉化為RL訓練環境，目前已有數十萬個此類環境。為了支援這種規模的訓練，團隊自研了代理原生RL框架Forge。該框架引入中間層，將底層訓練推理引擎與代理完全解耦，支援任意代理整合，並最佳化了模型在不同腳手架和工具間的泛化能力。通過最佳化非同步調度策略和樹狀結構的樣本合併策略，訓練速度提升了約40倍。在演算法層面，沿用了CISPO演算法以確保MoE模型在大規模訓練中的穩定性，並引入過程獎勵機制來解決長上下文中的信用分配難題。M2.5的實戰演練目前，M2.5已全面部署在MiniMax Agent中。通過將核心資訊處理能力提煉為標準化的Office技能，當處理Word格式化、PPT編輯和Excel計算等任務時，Agent會自動載入相應技能。使用者還可以結合特定領域的行業SOP與Office技能，建構針對特定場景的專家。例如在行業研究中，Agent可以嚴格遵循成熟的研究框架SOP，配合Word技能，自動抓取資料、梳理邏輯並輸出格式規範的研究報告，而非簡單的文字堆砌。在MiniMax公司內部，M2.5已經承擔了日常營運中30%的任務，覆蓋研發、產品、銷售、HR和財務等部門。在編碼場景中，M2.5生成的程式碼更是佔到了新提交程式碼量的80%。 (AI寒武紀)

科技